Flink1.14.2发布,除了log4j漏洞你还需要关注什么?
The following article is from 大数据技术与架构 Author 王知无
我挑了其中比较重要的列出来。
flink-pulsar-connector导致的OOM问题
Pulsar客户端在底层使用的 Netty 在 Java 11 和 Java 8 上分配内存的方式不同。在Java 11 上,它将从 Java 直接内存池中分配内存,并受 MaxDirectMemory限制。当前的Pulsar客户端没有用于控制内存限制的配置选项,这可能导致OOM。
建议用户在JDK8环境下使用Pulsar连接器,或者为Flink开启足够内存。
Table API & SQL
DataStream API and Table API的pipeline name修改为一致
批处理模式下 DataStream API 程序的默认作业名称已从"Flink Streaming Job"更改为"Flink Batch Job"。可以使用配置选项"pipeline.name"设置自定义名称。
fromChangelogStream方法
与 1.13.2 相比,StreamTableEnvironment.fromChangelogStream 方法可能会产生不同的流,因为之前没有正确考虑主键。
Table#flatMap支持新的类型推断
Table.flatMap() 现在支持新的类型系统。用户可以进行功能升级。
为新的 API 方法添加 Scala 隐式转换
在 DataStream API 和 Table API 之间新增新的 Scala 隐式转换。
删除 SQL 客户端中的 YAML 环境文件支持
sql-client-defaults.yaml 文件在 1.13 版本中已弃用,现在已完全删除。作为替代方法,您可以使用 -i 启动选项来执行 SQL 初始化文件以设置 SQL 客户端会话。SQL 初始化文件可以使用 Flink DDL 来定义可用的目录、表源和接收器、用户定义的函数以及其他执行和部署所需的属性。
废弃/删除了一些API
以下 Maven 模块已重命名:
flink-table-planner-blink -> flink-table-planner
flink-table-runtime-blink -> flink-table-runtime
flink-table-uber-blink -> flink-table-uber
由于删除了 BatchTableEnvironment,BatchTableSource 和 BatchTableSink 也被删除了。请改用 DynamicTableSource 和 DynamicTableSink。
TableEnvironment#connect方法删除
弃用 toAppendStream 和 toRetractStream
SQL Kafka 连接器和 SQL Elasticsearch 连接器的旧版本及其相应的旧格式已被删除。'connector.type='或'format.type='变更为'connector='选项。
删除 BatchTableSource/Sink、HBaseTableSource/Sink 和相关类
删除 BatchTableSource、ParquetTableSource和相关类
删除 BatchTableSource、OrcTableSource和相关类
PyFlink中删除BatchTableEnvironment和旧planner的使用
DataStream API
修复多个输入操作符的空闲处理
AbstractStreamOperator、Input 等类添加了 processWatermarkStatusX 方法。它允许在两个/多个输入操作符中组合水印时考虑 WatermarkStatus。
POJO字段上可以使用@TypeInfo注解
Connectors
暴露标准化Metrics
使用统一的 Source 和 Sink 接口的连接器将自动暴露某些标准化指标。
KafkaSink 取代了 FlinkKafkaProducer
FlinkKafkaConsumer废弃
Checkpoints
alignmentTimeout语义变更
alignmentTimeout配置的语义已经改变了含义,现在是检查点开始和任务接收到检查点屏障之间的时间。
BROADCAST 禁用未对齐检查点
广播分区不能与未对齐的检查点一起使用。因为无法保证在所有通道中以相同的速率消费数据。这可能导致某些任务应用与某个广播事件相对应的状态更改,而其他任务则不会。还原时,可能会导致状态不一致。
不在支持Apache Mesos
「Mesos is phasing out gradually and has been replaced with Kubernetes in the containerized world」。
准备和Mesos说在再见吧。
RECOMMEND
推荐阅读
这是一部从源代码角度出发,通过分析Flink的各个功能模块的实现来剖析Flink的架构设计和实现原理的著作。它将能指导读者更好地对Flink进行性能调优、可用性保障、效能优化和二次开发。
四位作者都是非常资深的Flink专家,部分作者是Flink源代码的维护者和改造者,本书总结了他们在阿里巴巴、蚂蚁集团、滴滴等企业的大规模Flink实践经验。
这是一本从源代码角度剖析Flink设计思想、架构原理以及各功能模块的底层实现原理的著作。
作者是Flink领域的资深技术专家和架构师,对Flink的源代码进行了深入分析和解读,同时融入了自己丰富的工程实践经验,既能让理解Flink的设计与实现原理,又能为他们解决性能优化等实际应用问题提供源码级别的指导。源码大多艰涩难懂,为了降低读者的学习门槛,本书提供了大量架构设计图、UML图和代码注释。
扫码关注【华章计算机】视频号
每天来听华章哥讲书
书讯 | 1月书讯(上)| 2022年的第一本书书讯 | 1月书讯(下)| 2022年的第一本书资讯 | Docker冲顶技术热词,微服务应用热度不减,中国云原生开发者真实现状如何?书单 | 8本书助你零基础转行数据分析岗干货 | 用Python写了一个图像文字识别OCR工具收藏 | Excel摸鱼技巧:快速实现分列转到行上新 | 【新书速递】高效使用Greenplum